沟通是协调多个代理商行为,广泛提出对环境的看法并支持其协作的有效机制。在多代理深度强化学习(MADRL)领域,代理可以改善整体学习绩效并通过交流来实现其目标。代理可以向所有代理或特定代理人组传达各种类型的消息,或者以特定的约束为条件。随着MADRL与交流的研究工作的成长(Comm-Madrl),缺乏一种系统和结构性的方法来区分和分类现有的COMM-MADRL方法。在本文中,我们调查了Comm-Madrl领域的最新作品,并考虑了可以在设计和开发多机构强化学习系统中发挥作用的沟通的各个方面。考虑到这些方面,我们提出了9个维度,可以分析,开发和比较comm-madrl方法。通过将现有作品投影到多维空间中,我们发现了有趣的趋势。我们还提出了一些新的方向,以通过探索尺寸的可能组合来签署未来的通信系统。
主要关键词
![arxiv:2203.08975v2 [cs.ma] 2024年10月18日PDF文件第1页](/bimg/5/514b9dad84c7d4a979d6dce4a92df60559792595.webp)
![arxiv:2203.08975v2 [cs.ma] 2024年10月18日PDF文件第2页](/bimg/1/1502d841c9dedb254d303691a7c836291ce728e7.webp)
![arxiv:2203.08975v2 [cs.ma] 2024年10月18日PDF文件第3页](/bimg/b/b43eaa56537e2a5755e28efa4ed3104878a7fab2.webp)
![arxiv:2203.08975v2 [cs.ma] 2024年10月18日PDF文件第4页](/bimg/a/a808bc7b59831ea56242cddd6a66582ebf62f0b7.webp)
![arxiv:2203.08975v2 [cs.ma] 2024年10月18日PDF文件第5页](/bimg/1/127145fb19b454e567cd9dbfdbf2e177346df100.webp)
